智能论文笔记

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose Regression and Odometry-aided Absolute Pose Regression

Felix Ott , Nisha Lakshmana Raichur , David Rügamer , Tobias Feigl , Heiko Neumann , Bernd Bischl , Christopher Mutschler

分类：计算机视觉

2022-08-01

视觉惯性定位是计算机视觉和机器人技术应用中的关键问题，例如虚拟现实，自动驾驶汽车和航空车。目的是在已知环境或动力学时估计物体的准确姿势。最近的方法使用卷积和时空网络直接回归姿势。绝对姿势回归（APR）技术可预测已知场景中图像输入的绝对摄像头姿势。进程方法执行相对姿势回归（RPR），该方法可预测已知对象动态（视觉或惯性输入）的相对姿势。可以通过检索跨模式设置的两个数据源的信息来改进本地化任务，这是一个挑战性的问题，这是由于矛盾的任务。在这项工作中，我们进行了基准，以评估基于PGO和注意力网络的深层多模式融合。辅助和贝叶斯学习已整合到APR任务中。我们展示了RPR AD的APR任务的准确性改进以及用于航空车辆和手持设备的RPR-RPR任务。我们在Euroc Mav和Penncosyvio数据集上进行实验，并记录一个新颖的行业数据集。

translated by 谷歌翻译

Team CERBERUS Wins the DARPA Subterranean Challenge: Technical Overview and Lessons Learned

Marco Tranzatto , Mihir Dharmadhikari , Lukas Bernreiter , Marco Camurri , Shehryar Khattak , Frank Mascarich , Patrick Pfreundschuh , David Wisth , Samuel Zimmermann , Mihir Kulkarni

分类：机器人

2022-07-11

本文介绍了Cerberus机器人系统系统，该系统赢得了DARPA Subterranean挑战最终活动。出席机器人自主权。由于其几何复杂性，降解的感知条件以及缺乏GPS支持，严峻的导航条件和拒绝通信，地下设置使自动操作变得特别要求。为了应对这一挑战，我们开发了Cerberus系统，该系统利用了腿部和飞行机器人的协同作用，再加上可靠的控制，尤其是为了克服危险的地形，多模式和多机器人感知，以在传感器退化，以及在传感器退化的条件下进行映射以及映射通过统一的探索路径计划和本地运动计划，反映机器人特定限制的弹性自主权。 Cerberus基于其探索各种地下环境及其高级指挥和控制的能力，表现出有效的探索，对感兴趣的对象的可靠检测以及准确的映射。在本文中，我们报告了DARPA地下挑战赛的初步奔跑和最终奖项的结果，并讨论了为社区带来利益的教训所面临的亮点和挑战。

translated by 谷歌翻译

BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing

Jason Alan Fries , Leon Weber , Natasha Seelam , Gabriel Altay , Debajyoti Datta , Samuele Garda , Myungsun Kang , Ruisi Su , Wojciech Kusa , Samuel Cahyawijaya

分类：自然语言处理

2022-06-30

培训和评估语言模型越来越多地要求构建元数据 - 多样化的策划数据收集，并具有清晰的出处。自然语言提示最近通过将现有的，有监督的数据集转换为多种新颖的预处理任务，突出了元数据策划的好处，从而改善了零击的概括。尽管将这些以数据为中心的方法转化为生物医学语言建模的通用域文本成功，但由于标记的生物医学数据集在流行的数据中心中的代表性大大不足，因此仍然具有挑战性。为了应对这一挑战，我们介绍了BigBio一个由126个以上的生物医学NLP数据集的社区库，目前涵盖12个任务类别和10多种语言。 BigBio通过对数据集及其元数据进行程序化访问来促进可再现的元数据策划，并与当前的平台兼容，以及时工程和端到端的几个/零射击语言模型评估。我们讨论了我们的任务架构协调，数据审核，贡献指南的过程，并概述了两个说明性用例：生物医学提示和大规模，多任务学习的零射门评估。 BigBio是一项持续的社区努力，可在https://github.com/bigscience-workshop/biomedical上获得。

translated by 谷歌翻译

Uncertainty-aware Evaluation of Time-Series Classification for Online Handwriting Recognition with Domain Shift

Andreas Klaß , Sven M. Lorenz , Martin W. Lauer-Schmaltz , David Rügamer , Bernd Bischl , Christopher Mutschler , Felix Ott

分类：计算机视觉 | 人工智能

2022-06-17

对于许多应用，分析机器学习模型的不确定性是必不可少的。尽管不确定性量化（UQ）技术的研究对于计算机视觉应用非常先进，但对时空数据的UQ方法的研究较少。在本文中，我们专注于在线手写识别的模型，这是一种特定类型的时空数据。数据是从传感器增强的笔中观察到的，其目标是对书面字符进行分类。我们基于两种突出的贝叶斯推理，平均高斯（赃物）和深层合奏的突出技术对核心（数据）和认知（模型）UQ进行了广泛的评估。在对模型的更好理解后，UQ技术可以在组合右手和左撇子作家（一个代表性不足的组）时检测分布数据和域的变化。

translated by 谷歌翻译

Domain Adaptation for Time-Series Classification to Mitigate Covariate Shift

Felix Ott , David Rügamer , Lucas Heublein , Bernd Bischl , Christopher Mutschler

分类：机器学习 | 人工智能

2022-04-07

当机器学习模型将其应用于与最初训练的数据相似但不同的域中的数据时，它的性能会降低。为了减轻此域移位问题，域Adaptation（DA）技术搜索了最佳转换，该转换将（当前）输入数据从源域转换为目标域，以学习域名不变的表示，以减少域差异。本文根据两个步骤提出了一个新颖的监督DA。首先，我们从几个样本中搜索从源到目标域的最佳类依赖性转换。我们考虑了最佳的运输方法，例如地球搬运工的距离，凹痕传输和相关对准。其次，我们使用嵌入相似技术在推理时选择相应的转换。我们使用相关指标和高阶矩匹配技术。我们对具有域移动的时间序列数据集进行了广泛的评估，包括模拟和各种在线手写数据集，以演示性能。

translated by 谷歌翻译

Benchmarking Online Sequence-to-Sequence and Character-based Handwriting Recognition from IMU-Enhanced Pens

Felix Ott , David Rügamer , Lucas Heublein , Tim Hamann , Jens Barth , Bernd Bischl , Christopher Mutschler

分类：机器学习

2022-02-14

目的。手写是日常生活中最常见的模式之一，由于它具有挑战性的应用，例如手写识别（HWR），作家识别和签名验证。与仅使用空间信息（即图像）的离线HWR相反，在线HWR（ONHWR）使用更丰富的时空信息（即轨迹数据或惯性数据）。尽管存在许多离线HWR数据集，但只有很少的数据可用于开发纸质上的ONHWR方法，因为它需要硬件集成的笔。方法。本文为实时序列到序列（SEQ2SEQ）学习和基于单个字符的识别提供了数据和基准模型。我们的数据由传感器增强的圆珠笔记录，从三轴加速度计，陀螺仪，磁力计和力传感器100 \，\ textit {hz}产生传感器数据流。我们建议各种数据集，包括与作者依赖和作者无关的任务的方程式和单词。我们的数据集允许在平板电脑上的经典ONHWR与传感器增强笔之间进行比较。我们使用经常性和时间卷积网络和变压器与连接派时间分类（CTC）损失（CTC）损失（CE）损失，为SEQ2SEQ和基于单个字符的HWR提供了评估基准。结果。我们的卷积网络与Bilstms相结合，优于基于变压器的架构，与基于序列的分类任务的启动时间相提并论，并且与28种最先进的技术相比，结果更好。时间序列扩展方法改善了基于序列的任务，我们表明CE变体可以改善单个分类任务。

translated by 谷歌翻译

Leveraging Synthetic Data in Object Detection on Unmanned Aerial Vehicles

Benjamin Kiefer , David Ott , Andreas Zell

分类：计算机视觉

2021-12-22

获取数据以培训基于深入的学习的对象探测器（无人机）昂贵，耗时，甚至可以在特定环境中禁止。另一方面，合成数据快速且便宜。在这项工作中，我们探讨了在各种应用环境中从UVS探讨了对象检测中的合成数据。为此，我们将开源框架DeepGtav扩展到UAV方案的工作。我们在多个域中捕获各种大规模的高分辨率合成数据集，以通过分析多种型号的多种培训策略来展示它们在真实对象检测中的使用。此外，我们分析了几种不同的数据生成和采样参数，以提供可操作的工程建议，以获得进一步的科学研究。DeepGTAV框架可在https://git.io/jyf5j提供。

translated by 谷歌翻译

Sustainable AI: Environmental Implications, Challenges and Opportunities

Carole-Jean Wu , Ramya Raghavendra , Udit Gupta , Bilge Acun , Newsha Ardalani , Kiwan Maeng , Gloria Chang , Fiona Aga Behram , James Huang , Charles Bai

分类：机器学习 | 人工智能

2021-10-30

本文探讨了超线性增长趋势的环境影响，从整体角度来看，跨越数据，算法和系统硬件。我们通过在行业规模机器学习用例中检查模型开发周期来表征AI计算的碳足迹，同时考虑系统硬件的生命周期。进一步迈出一步，我们捕获AI计算的操作和制造碳足迹，并为硬件 - 软件设计和尺度优化的结束分析以及如何帮助降低AI的整体碳足迹。根据行业经验和经验教训，我们分享关键挑战，并在AI的许多方面上绘制了重要的发展方向。我们希望本文提出的关键信息和见解能够激发社区以环保的方式推进AI领域。

translated by 谷歌翻译

fairseq: A Fast, Extensible Toolkit for Sequence Modeling

Myle Ott , Sergey Edunov , Alexei Baevski , Angela Fan , Sam Gross , Nathan Ng , David Grangier , Michael Auli

分类：

2019-04-01

FAIRSEQ is an open-source sequence modeling toolkit that allows researchers and developers to train custom models for translation, summarization, language modeling, and other text generation tasks. The toolkit is based on PyTorch and supports distributed training across multiple GPUs and machines. We also support fast mixed-precision training and inference on modern GPUs. A demo video can be found here: https://www.youtube. com/watch?v=OtgDdWtHvto.

translated by 谷歌翻译